home *** CD-ROM | disk | FTP | other *** search
/ Cream of the Crop 26 / Cream of the Crop 26.iso / educate / trutran2.zip / ARTICLE3 < prev    next >
Text File  |  1996-12-14  |  24KB  |  500 lines

  1.  
  2.               *** PRESS ANY KEY TO SEE THE NEXT SCREEN ***
  3.  
  4.          If you wish to print this article or view it in its
  5.          entirety, please load it into your word processor
  6.                           as ARTICLE3.
  7.  
  8.                    *********************************
  9.                    *    For an overview of these   *
  10.                    *  articles, please first read  * 
  11.                    *     the file ARTICLE0.SEE     *
  12.                    *********************************
  13.  
  14.  
  15.           Where Do Translators Fit Into Machine Translation?
  16.      
  17.                  Original And Supplementary Questions
  18.  
  19.                            By Alex Gross
  20.                            
  21.             Submitted to the MT SUMMIT III Conference
  22.                   June 3, 1991  2:00 -- 3:45 PM  
  23.  
  24.             (and later published in the Sci-Tech Translation 
  25.                         Journal, April, 1993)
  26.  
  27. Here are the original questions for this panel as submitted to the 
  28. speakers: 
  29.  
  30.      1.  At the last MT Summit, Martin Kay stated that there should 
  31. be "greater attention to empirical studies of translation so that 
  32. computational linguists will have a better idea of what really goes 
  33. on in translation and develop tools that will be more useful for the 
  34. end user."  Does this mean that there has been insufficient input 
  35. into MT processes by translators interested in MT?    Does it mean 
  36. that MT developers have failed to study what translating actually 
  37. entails and how translators go about their task?  If either of these 
  38. is true, then to what extent and why? New answers and insights for 
  39. the MT profession could arise from hearing what human translators 
  40. with an interest in the development of MT have to say about these 
  41. matters.  It may well turn out that translators are the very people 
  42. best qualified to determine what form their tools should take, since 
  43. they are the end users. 
  44.      2.  Is there a specifically "human" component in the 
  45. translation process which MT experts have overlooked?  Is it 
  46. reasonable for theoreticians to envision setting up predictable and 
  47. generic vocabularies of clearly defined terms, or could they be 
  48. overlooking a deep-seated human tendency towards some degree of 
  49. ambiguity--indeed, in those many cases where not all the facts are 
  50. known, an inescapably human reliance on it?  Are there any viable MT 
  51. approaches to duplicate what human translators can provide in such 
  52. cases, namely the ability to bridge this ambiguity gap and improvise 
  53. personalized, customized case- specific subtleties of vocabulary, 
  54. depending on client or purpose?  Could this in fact be a major 
  55. element of the entire translation process?  Alternately, are there 
  56. some more boring "machine-like" aspects of translation where the 
  57. computer can help the translator, such as style and consistency 
  58. checking? 
  59.      3.  How can the knowledge of practicing translators best be 
  60. integrated into current MT research and working systems?  Is it to 
  61. be assumed that they are best employed as prospective end- users 
  62. working out the bugs in the system, or is there also a place for 
  63. them during the initial planning phases of such systems?  Can they 
  64. perhaps as users be the primary developers of the system? 
  65.      4.  Many human translators, when told of the quest to have 
  66. machines take over all aspects of translation, immediately reply 
  67. that this is impossible and start providing specific instances which 
  68. they claim a machine system could never handle.  Are such reactions 
  69. merely the final nerve spasms of a doomed class of technicians 
  70. awaiting superannuation, or are these translators in fact 
  71. enunciating specific instances of a general law as yet not fully 
  72. articulated?  Since we now hear claims suggesting that FAHQT is 
  73. creeping in again through the back door, it seems important to ask 
  74. whether there has in fact ever been sufficient basic mathematical 
  75. research, much less algorithmic underpinnings, by the MT Community 
  76. to determine whether FAHQT, or anything close to it, can be achieved 
  77. by any combination of electronic stratagems (transfer, AI, neural 
  78. nets, Markov models, etc.). Must translators forever stand exposed 
  79. on the firing line and present their minds and bodies to a broadside 
  80. of claims that the next round of computer advances will annihilate 
  81. them as a profession?  Is this problem truly solvable in logical 
  82. terms, or is it in fact an intractable, undecidable, or provably 
  83. unsolvable question in terms of "Computable Numbers" as set out by 
  84. Turing, based on the work of Hilbert and Goedel?  A reasonable 
  85. answer to this question could save boards of directors and/or 
  86. government agencies a great deal of time and money. 
  87.  
  88.  
  89.      SUPPLEMENTAL QUESTIONS 
  90.      It was also envisioned that a list of Supplemental Questions 
  91. would be prepared and distributed not only to the speakers but 
  92. everyone attending our panel, even though not all of these questions 
  93. could be raised during the session, so as to deepen our discussion 
  94. and provide a lasting record of these issues. 
  95.  
  96.      FAHQT: Pro and Con 
  97.  
  98.      Consider the following observation on FAHQT: "The ideal notion 
  99. of fully automatic high quality translation (FAHQT) is still lurking 
  100. behind the machine translation paradigm: it is something that MT 
  101. projects want to reach." (1)  Is this a true or a false observation? 
  102.  
  103.      Is FAHQT merely a matter of time and continued research, a 
  104. direct and inevitable result of a perfectly asymptotic process? 
  105.  
  106.      Will FAHQT ever be available on a held-held calculator-sized 
  107. computer?  If not, then why not? 
  108.  
  109.      To what extent is the belief in the feasibility of FAHQT a form 
  110. of religion or perhaps akin to a belief that a perpetual motion 
  111. device can be invented? 
  112.  
  113.      Technical Linguistic Questions 
  114.      Let us suppose a writer has chosen to use Word C in a source 
  115. text because s/he did not wish to use Word A or Word B, even though 
  116. all three are shown as "synonyms."  It turns out that all three of 
  117. these words overlap and semantically interrelate quite differently 
  118. in the target language.  How can MT handle such an instance, fairly 
  119. frequently found in legal and diplomatic usage? 
  120.  
  121.      Virtually all research in both conventional and computational 
  122. linguistics has proceeded from the premise that language can be 
  123. represented and mapped as a linear entity and is therefore eminently 
  124. computable.  What if it turns out that language in fact occupies a 
  125. virtual space as a multi-dimensional construct, including several 
  126. fractal dimensions, involving all manner of non-linear turbulence, 
  127. chaos, and Butterfly Effects?
  128.  
  129.      Post-Editors and Puppeteers
  130.      
  131.      Let's assume you saw an ad for an Automatic Electronic
  132. Puppeteer that guaranteed to create and produce endless puppet
  133. plays in your own living room.  There would be no need for a
  134. puppeteer to run the puppets and no need for you even to script
  135. the plays, though you would have the freedom to intervene in the
  136. action and change the plot as you wished.  Since the price was
  137. acceptable, you ordered this system, but when it arrived, you
  138. found that it required endless installation work and calls to the
  139. manufacturers to get it working.  But even then, you discovered
  140. that the number of plays provided was in fact quite limited, your
  141. plot change options even more so, and that the movements of the
  142. puppets were jerky and unnatural.  When you complained, you were
  143. referred to fine print in the docs telling you that to make the
  144. program work better, you would have to do one of two things: 1)
  145. master an extremely complex programming language or 2) hire a
  146. specially trained puppeteer to help you out with your special
  147. needs and to be on hand during your productions to make the
  148. puppets move more naturally.  Does this description bear any
  149. resemblance to the way MT has functioned and been promoted in
  150. recent years?
  151.      
  152.      
  153.                          A Practical Example
  154.      
  155.      Despite many presentations on linguistic, electronic and
  156. philosophical aspects of MT at this conference, one side of
  157. translation has nonetheless gone unexplored.  It has to do with
  158. how larger translation projects actually arise and are handled by
  159. the profession.  The following story shows the world of human
  160. translation at close to its worst, and it might be imagined at
  161. first glance that MT could easily do a much better job and simply
  162. take over in such situations, which are far from atypical in the
  163. world of translation.  But, as we shall see, such appearances may
  164. be deceptive.  To our story:
  165.      
  166.      A French electrical firm was recently involved in a hostile
  167. take-over bid and law suit with its American counterpart.  Large
  168. numbers of boxes and drawers full of documents all had to be
  169. translated into English by an almost impossible deadline.
  170. Supervision of this work was entrusted to a paralegal assistant
  171. in the French company's New York law firm. This  person had no
  172. previous knowledge of translation.  The documents ran the gamut
  173. from highly technical electrical texts and patents, records of
  174. previous law suits, company correspondence, advertisements,
  175. product documentation, speeches by the Company's directors, etc.
  176. Almost every French-to-English translator in the NYC area was
  177. asked to take part.  All translators were required to work at the
  178. law firm's offices so as to preserve confidentiality.  Mere
  179. translation students worked side by side with newly accredited
  180. professionals and journeymen with long years of experience.  The
  181. more able quickly became aware that much of the material was far
  182. too difficult for their less experienced colleagues.  No
  183. consistent attempt was made to create or distribute glossaries.
  184. Wildly differing wages were paid to translators, with little
  185. connection to their ability.  Several translation agencies were
  186. caught up in a feverish battle to handle most of the work and
  187. desperately competed to find translators.  No one knows the
  188. quality of the final product, but it cannot have been routinely
  189. high.  Some translators and agencies have still not been fully
  190. paid.  As the deadline drew closer, more and more boxes of
  191. documents appeared.  And as the final blow, the opposing
  192. company's law firm also came onto the scene with boxes of its own
  193. documents that needed translation.  But these newcomers imposed
  194. one nearly impossible condition, also for reasons of
  195. confidentiality: no one who had translated for the first law firm
  196. would be permitted to translate for them.
  197.  
  198.      Now let us consider this true-life tale, which occurred just
  199. three months ago, and see how--or whether--MT could have handled
  200. things better, as is sometimes claimed.  Let's be generous and
  201. remove one enormous obstacle at the start by assuming that all
  202. these cases of documents were in fact in machine-readable form
  203. (which, of course, they weren't).  Even if we accord MT this
  204. ample handicap, there are still a number of problems it would
  205. have had trouble coping with:
  206.      
  207.      1.  How could a sufficient number of competent post-editors
  208. be found or trained before the deadline?
  209.  
  210.      2.  How could a sufficiently large and accurate MT
  211. dictionary be compiled before the deadline?  Doesn't creating such
  212. a dictionary require finishing the job first and then
  213. saving it for the next job, in the hope that it will be similar ?
  214.  
  215.      3.  The simpler Mom & Pop store & smaller agency structure
  216. of the human translation world was nonetheless able to
  217. field at least some response to this challenge because of its
  218. large slack capacity.  Would an enormously powerful and
  219. expensive mainframe computer have the same slack capacity,
  220. i.e., could it be kept inactive for long periods of
  221. time until such emergencies occurred?  If so, how would this be
  222. reflected in the prices charged for its services?
  223.  
  224.      4.  How would MT companies have dealt with the secrecy
  225. requirement, that translation must be done in the law firm's office?
  226.  
  227.      5.  How would an MT Company comply with the demand of the
  228. second law firm, that the same post-editors not be used, and 
  229. still land the job?
  230.  
  231.      6.  Supposing the job proved so enormous that two MT firms
  232. had to be hired--assuming they used different systems,
  233. different glossaries, different post-editors, how
  234. could they have collaborated without creating even
  235. more work and confusion?
  236.      
  237.      
  238.                     Larger Philosophical Questions
  239.      
  240.      
  241.      Is it in any final sense a reasonable assumption, as many
  242. believe, that progress in MT can be gradual and cumulative in
  243. scope until it finally comes to a complete mastery of the
  244. problem?  In other words, is there a numerical process by which
  245. one first masters 3% of all knowledge and vocabulary building
  246. processes with 85% accuracy, then 5% with 90% accuracy, and so on
  247. until one reaches 99% with 99% accuracy?  Is this the whole story
  248. of the relationship between knowledge and language, or are there
  249. possibly other factors involved, making it possible for reality
  250. to manifest itself from several unexpected angles at once.  In
  251. other words, are we dealing with language as a linear entity when
  252. it is in fact a multi-dimensional one?
  253.  
  254.  
  255.      Einstein maintained that he didn't believe God was playing
  256. dice with the universe.  Is it possible that by using AI rule-
  257. firing techniques with their built-in certainty and confidence
  258. values, computational linguists are playing dice with the meaning
  259. of the that universe?
  260.      
  261.      It would be possible to design a set of "Turing Tests" to
  262. gauge the performance of various MT systems as compared with
  263. human translation skills.  The point of such a process, as with
  264. all Turing Tests, would be to determine if human referees could
  265. tell the difference between human and machine output.  All
  266. necessary safeguards, handicaps, alternate referees, and double
  267. blind procedures could be devised, provided the will to take part
  268. in such tests actually existed.  True definitions for cost,
  269. speed, accuracy, and post-editing needs might all have at least a
  270. chance of being estimated as a result of such tests.  What are
  271. the chances of their taking place some time in the near future?
  272.      
  273.      "Computerization is the first stage of the industrial
  274. revolution that hasn't made work simpler."  Does this statement,
  275. paraphrased from a book by a Harvard Business School professor,
  276. (2) have any relevance for MT?  Is it correct to state that
  277. several current MT systems actually add one or more levels of
  278. difficulty to the translation process before making it any
  279. easier?
  280.      
  281.      While translators may not be able to articulate precisely
  282. what kind of interface for translation they most desire, they can
  283. certainly state with great certainty what they do NOT want.  What
  284. they do not want is an interface that is any of the following:
  285.      
  286.           harder to learn and use than conventional translation;
  287.  
  288.           more likely to make mistakes than the above;
  289.  
  290.           lending less prestige than the above;
  291.  
  292.           less well paid than the above.
  293.  
  294. Are these also concerns for MT developers?
  295.      
  296.      
  297.      What real work has been done in the AI field in terms of
  298. treating translation as a Knowledge Domain and translators as
  299. Domain Experts and pairing them off with Knowledge Engineers?
  300. What qualifications were sought in either the DE's or the KE's?
  301.      
  302.      Are MT developers using the words "asymptote" and
  303. "asymptotic" in their correct mathematical sense, or are they
  304. rather using them as buzzwords to impart a false air of
  305. mathematical precision to their work?  Is the curve their would-
  306. be asymptote steadily approaching a representation of FAHQT or
  307. something reasonably similar, or could it just turn out to be the
  308. edge of a semanto-linguistic Butterfly Effect drawing them
  309. inexorably into what Shannon and Weaver recognized as entropy,
  310. perhaps even into true Chaos?
  311.  
  312.  
  313.      Must not all translation, including MT, be recognized as a
  314. subset of two far larger sets, namely writing and human
  315. mediation?  In the first case, does it not therefore become
  316. pointless to maintain that there are no accepted standards for
  317. what constitutes a "good translation," when of course there are
  318. also no accepted standards for what constitutes "good writing?"
  319. Or for that matter, no accepted standards for what constitutes
  320. "correct writing practices," since all major publications and
  321. publishing houses have their own in-house style manuals, with no
  322. two in total agreement, either here or in England.  And is not
  323. translation also a specialized subset of a more generalized form
  324. of "mediation," merely employing two natural languages instead of
  325. one?  In which case, may it belong to the same superset which
  326. includes "explaining company rules to new employees," public
  327. relations and advertising, or choosing exactly the right 
  328. time to tell Uncle Louis you're marrying someone he 
  329. disapproves of?  Are not the only real differences 
  330. between foreign language translation and such upscale
  331. mediation that two languages are involved and the context is
  332. usually more limited?  In either case (or in both together), what
  333. happens if  all the complexities that can arise from superset
  334. activities descend into the subset and also become  "translation
  335. problems?" at any time?  How does MT deal with either of these
  336. cases?
  337.      
  338.      Does the following reflection by Wittgenstein apply to MT:
  339.  
  340. "A sentence is given me in code together with the key.  Then of
  341. course in one way everything required for understanding the
  342. sentence has been given me.  And yet I should answer the question
  343. `Do you understand this sentence?': No, not yet; I must first
  344. decode it.  And only when e.g. I had translated it into English
  345. would I say `Now I understand it.'
  346.  
  347.      "If now we raise the question `At what moment of translating
  348. do I understand the sentence? we shall get a glimpse into the
  349. nature of what is called `understanding.'"  To take
  350. Wittgenstein's example one step further, if MT is used, at what
  351. moment of translation does what person or entity understand the
  352. sentence?  When does the system understand it?  How about the
  353. hasty post-editor?  And what about the translation's target
  354. audience, the client?  Can we be sure that understanding has
  355. taken place at any of these moments?  And if understanding has
  356. not taken place, has translation?
  357.      
  358.      
  359.                  Practical Suggestions for the Future
  360.      
  361.      1.  The process of consultation and cooperation between
  362. working translators and MT specialists which has begun here today
  363. should be extended into the future through the appointment of
  364. Translators in Residence in university and corporate settings,
  365. continued lectures and workshops dealing with these themes on a
  366. national and international basis, and greater consultation
  367. between them in all matters of mutual concern.
  368.      
  369.      2.  In the past, many legislative titles for training and
  370. coordinating workers have gone unused during each Congressional
  371. session in the Department of Labor, HEW, and Commerce.  If there
  372. truly is a need for retraining translators to use MT and CAT
  373. products, it behooves system developers--and might even benefit
  374. them financially--to find out if such funding titles can be used
  375. to help train translators in the use of truly viable MT systems.
  376.      
  377.      3.  It should be the role of an organization such as MT
  378. Summit III to launch a campaign aimed at helping people
  379. everywhere to understand what human translation and machine
  380. translation can and cannot do so as to counter a growing trend
  381. towards fast-word language consumption and use.
  382.  
  383.      4.  Concomitantly, those present at this Conference should
  384. make their will known on an international scale that there is no
  385. place in the MT Community for those who falsify the facts about
  386. the capabilities of either MT or human translators.  The fact
  387. that foreign language courses, both live and recorded, have been
  388. deceitfully marketed for decades should not be used as an excuse
  389. to do the same with MT.  I have appended a brief Code of Ethics
  390. document for discussion of this matter.
  391.      
  392.      5.  Since AI and expert systems are on the lips of many as
  393. the next direction for MT, a useful first step in this direction
  394. might be the creation of a simple expert system which prospective
  395. clients might use to determine if their translation needs are
  396. best met by MT, human translation, or some combination of both.
  397. I would be pleased to take part in the design of such a program.
  398.  
  399.      
  400.                          DRAFT CODE OF ETHICS
  401.                                      
  402.      1.  No claims about existing or pending MT products should
  403. be made which indicate that MT can reduce the number of human
  404. translators or the total cost of translation work unless all
  405. costs for the MT project have been scrupulously revealed,
  406. including the total price for the system, fees or salaries for
  407. those running it, training costs for such workers, training costs
  408. for additional pre-editors or post-editors including those who
  409. fail at this task, and total costs of amortization over the full
  410. period of introducing such a system.
  411.      
  412.      2.  No claims should be made for any MT system in terms of
  413. "percentage of accuracy," unless this figure is also spelled out
  414. in terms of number of errors per page.  Any unwillingness to
  415. recognize errors as errors shall be considered a violation of
  416. this condition, except in those cases where totally error-free
  417. work is not required or requested.
  418.      
  419.      3.  No claim should be made that any MT system produces
  420. "better-quality output" than human translators unless such a
  421. claim has been thoroughly quantified to the satisfaction of all
  422. parties.  Any such claim should be regarded as merely anecdotal
  423. until proved otherwise.
  424.      
  425.      4.  Researchers and developers should devote serious study
  426. to the issue of whether their products might generate less sales
  427. resistance, public confusion, and resentment from translators if
  428. the name of the entire field were to be changed from "machine
  429. translation" or "computer translation" to "computer assisted
  430. language conversion."
  431.      
  432.      5.  The computer translation industry should bear the cost
  433. of setting up an equitably balanced committee of MT workers and
  434. translators to oversee the functioning of this Code of Ethics.
  435.      
  436.      6.  Since translation is an intrinsically international
  437. industry, this Code of Ethics must also be international in its
  438. scope, and any company violating its tenets on the premise that
  439. they are not valid in its country shall be considered in
  440. violation of this Code.  Measures shall be taken to expose and
  441. punish habitual offenders.
  442.      
  443.      
  444.      Respectfully Submitted by
  445.      Alex Gross, Co-Director
  446.      Cross-Cultural Research Projects
  447.      P.O. Box 660--Cooper Station
  448.      New York, NY 10276
  449.      (212) 777-7609
  450.      CompuServe: 71071,1520
  451.      
  452.      (1)  Kimmo Kettunen, in a letter to Computational
  453. Linguistics, vol. 12, No. 1, January-March, 1986
  454.      
  455.      (2)  Shoshana Zuboff: In the Age of the Smart Machine:
  456. The Future of Work and Power, Basic Books, 1991.
  457.  
  458.  
  459.              Copyright 1991 and 1995 by Alexander Gross
  460.  
  461.                            This piece may be reproduced for
  462.                            individuals and for educational
  463.                            purposes.  It may not be used for
  464.                            any commercial (i.e., money-making)
  465.                            purpose without written permission
  466.                            from the author.
  467.  
  468.  
  469.  
  470.  
  471.  
  472.  
  473.  
  474.  
  475.  
  476.  
  477.  
  478.  
  479.  
  480.  
  481.  
  482.  
  483.  
  484.  
  485.  
  486.  
  487.  
  488.  
  489.  
  490.  
  491.  
  492.  
  493.  
  494.  
  495.  
  496.  
  497.  
  498.  
  499.  
  500.